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摘 要 : 为 保 谭 境外 出 行人 员 的 境外 活动 安全 ， 针 对 现 有 的 数据 存在 数据 缺失 、 类 型 多 样 且 类 型 不 一 致 等 问题 ， 在 
相关 评估 标准 缺失 的 情况 下 提出 了 一 种 基于 多 类 别 参数 随机 调 优 的 境外 活动 安全 态势 评估 模型 ， 构 建 数据 量化 、 算 
选 机 制 ， 自 适应 调整 模型 参数 ， 获 得 安全 告 果 并 分 级 ， 最 终 实 现 对 安全 态势 评估 和 预警 。 通 过 与 相关 评估 方案 
及 国际 范围 内 的 真实 恐怖 袭击 事件 的 分 布 进行 比 对 分 析 ， 验 证 了 安全 评估 模型 的 准确 性 ， 相 应 系统 具有 一 定 的 实用 
价值 。 
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Abstract: To ensure the security of oversea travelers, this paper proposes a security situation assessment model for oversea 
activities based on multi-class parameters random tuning. However, the existing related data has problems of missing data, 
various types and inconsistent types. In the absence of relevant evaluation criteria, this paper constructing data 
quantification and screening mechanism, and adjust the model parameters adaptively, by which the safety assessment results 
are obtained and ranked, achieve security posture assessment and early warning. The accuracy of the proposed safety 
situation assessment model is demonstrated by comparing it with the distribution of real-world international terrorist events. , 
the corresponding system has certain practical value. 
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za 需要 准确 且 有 效 地 分 析 全 球 安全 态势 ， 以 便 有 

B 合理 的 预警 ,保障 企业 和 个 人 的 境外 活动 安全 
20 世纪 90 年 代 以 来 ， 经 济 全 球 化 的 浪潮 迅 狐 发 展 ， 改 为 了 防范 安全 隐患 ， 如 何 有 效 地 综合 各 类 恐 忆 袭击 事件 
变 了 以 往 国 家 、 地 域 之 间 的 界限 ， 对 当代 国际 政治 经 济 格局 言 息 ， 评 估 国 际 安全 形势 已 经 成 为 了 一 个 重要 的 研究 课题 。 


o 


产生 了 极其 深刻 的 影响 说 。 随 着 经 济 全 球 化 和 区 域 合作 的 不 国际 上 对 妨 怖 袭击 事件 的 定义 如 下 : 非 政府 组 织 或 个 人 ， 威 
新 发 展 ， 世 界 各 国 间 相互 依赖 关系 进一步 加 强 ， 社 会 政治 、 办 或 实际 使 用 非法 武力 和 暴力 ,通过 胁迫 或 鸭 吓 以 达到 政治 、 
文化 以 及 人 们 的 思想 观念 等 社会 生活 各 方面 都 发 生 了 巨大 的 经 济 、 宗 教 或 社会 目的 的 行为 。 这 意味 着 恐怖 袭击 事件 必须 
改变 。 世 界 各 国 争 相 开辟 国际 市 场 ， 以 跨国 投资 和 经 营 为 特 包含 所 有 以 下 三 个 属性 : 必须 是 有 意 而 为 之 的 事件 ， 必 须 具 
征 的 经 济 全 球 化 发 展 已 呈现 锐 不 可 挡 之 势 。 随 着 这 些 跨 国 公 备 暴力 或 直接 的 暴力 威胁 性 质 〈 和 危害 财产 及 人 身 安 全 ) ; 事 
司 的 建立 ， 企 业 人 员 的 境外 活动 的 日 益 增 多 。 同 时 ， 随 着 物 件 的 发 起 者 必须 是 非 政 府 的 组 织 或 个 人 。 从 上 述 属 性 可 以 总 
质 生 活 的 不 断 提高 ， 越 来 越 多 的 人 倾向 于 选择 出 国 留 学 或 旅 结 得 出 一 个 对 恐怖 缆 击 事件 的 简单 描述 ， 恐 怖 缆 击 事件 完全 
行 。 然 而 ， 在 前 往 世 界 各 国 进行 交流 和 合作 的 过 程 中 ， 企 业 是 人 为 的 有 针对 性 的 大 规模 恶性 暴力 事件 。 这 是 恐怖 袭击 事 
与 个 人 往往 面临 着 潜在 的 安全 风险 。 在 当今 世界 经 济 、 社 会 件 区 别 于 其 他 突 发 事件 的 本 质 特征 。 自 然 灾害 ， 事 故 等 突 发 
不 稳定 因素 的 影响 下 ， 汐 怖 主义 、 跨 国 犯 罪 等 非 传 统 安 全 威 ”事件 同一 会 造成 大 规模 的 财产 和 人 生 安 全 损失 ， 但 是 这 些 事 
HE Hug. 涉及 区 域 广 泛 ， 为 企业 与 个 人 的 境外 活动 增添 件 并 不 是 有 意 而 为 之 的 事件 ， 相 对 而 言 更 加 容易 进行 管控 和 
了 不 确定 因素 中 。 如 图 1 所 示 ， 过 去 20 年 来 ， 世 界 范围 内 恐 预测 。 
怖 事件 时 有 发 生 ， 鸭 怖 事件 频率 逐年 上 涨 。 为 了 有 效应 对 这 文献 [3] 系 统 地 探讨 了 我 国 应 急 管理 体制 框架 的 建立 , 在 
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突 发 事件 分 级 的 问题 上 ,指出 分 级 标准 需要 依据 事件 的 性 质 、 ” 估 模 型 。 依 据 分 级 结果 ， 实 现 对 现 有 国际 安全 态势 的 评估 。 
严重 程度 、 可 控 性 和 影响 范围 等 要 素 加 以 确定 和 细 化 。 文 献 最 终结 果 证 明 ， 本 文 所 提出 的 模型 可 以 准确 有 效 地 实现 对 现 
[4 基于 我 国 突 发 事件 分 级 规定 ,将 云 模型 理论 引入 到 突 发 事 。 有 数据 的 量化 分 级 ， 并 进一步 实现 对 现 有 国际 安全 态势 的 准 
件 分 级 研究 中 ， 根 据 领域 专家 意见 确定 分 级 指标 体系 ， 解 决 。 确 评估 与 预测 。 

了 分 级 过 程 中 存在 的 模糊 性 、 随 机 性 等 问题 。 文 献 [5] 提 出 一 —— EET 

神 改进 模糊 综合 评价 的 方法 ， 该 方法 结合 我 国 《 国 家 突 发 环 1” 卉 外 活动 安全 态势 评估 系统 


境 事 件 应 急 预 案 》 当 中 的 有 关 规 定 ， 从 六 个 方面 建立 影响 攻 前 ， 尚 没有 明确 的 标准 来 对 恐怖 袭击 事件 的 危害 性 进 
素 集合 ， 形 成 分 级 指标 与 等 级 ， 针 对 同时 包含 定量 和 定性 决 — (TA C SYEfh. AERIS E XH HEUS (global terrorism 
策 信息 的 突 发 环境 事件 分 级 问题 ， 在 权重 的 确定 上 利用 炉 权 database, GTD) 是 一 个 开源 数据 库 ， 包 括 1970 年 至 2017 年 
法 和 改进 模糊 层次 分 析 法 求 得 事件 属性 的 客观 权重 与 主观 权 全球 巩 怖 主义 事件 的 信息 ， 对 于 每 个 GTD 事件 ， 都 可 以 获 
重 ， 最 后 构建 模糊 评价 矩阵 进行 综合 判断 ， 为 突 发 事件 的 等 ” 得 记录 事件 的 各 类 型 特征 数据 ， 如 有 关 事 件 发 生 的 日 期 和 地 
级 评估 提供 一 种 有 效 的 方法 。 然 而 ， 在 以 上 工作 的 研究 对 象 。” 点 、 死 亡 人 数 、 使 用 的 武器 和 目标 的 性 质 、 事 件 的 连续 性 以 
主要 集中 于 自然 灾害 、 有 害 物 质 泄漏 等 问题 ， 其 方法 依据 现 ”及 负责 的 团体 或 个 人 的 信息 。 然 而 ， 类 似 于 其 他 恐怖 袭击 事 
有 的 相关 规定 与 标准 对 问题 进行 分 级 与 评估 ， 对 于 涉及 个 人 Fa, GTD 记录 这 些 事件 的 数据 类 型 复杂 多 样 ， 且 存在 数 
与 企业 的 人 身 安全 以 及 没有 明确 分 级 标准 的 您 怖 袭击 事件 ， 据 缺 失 ， 难 以 使 用 统一 方法 或 模型 进行 量化 分 析 与 处 理 。 如 
以 上 方法 无 法 直接 应 用 。 可 基于 这 样 类 型 多 样 的 数据 构建 准确 的 地 区 安全 态势 评估 模 
型 具有 极 大 的 挑战 。 本 文 有 针对 性 地 研究 数据 量化 与 综合 评 
1690 4 十 模型 ， 实 现 了 对 不 同 地 区 安全 态势 的 准确 评估 。 首 先 ， 为 
moo 1 了 构建 综合 评估 模型 ， 研 究 二 分 类 型 特征 、 多 分 类 型 特征 及 
12000 4 文本 型 特征 的 数值 量化 方法 ;， 其次， 从 海量 特征 中 降 维 筛选 
10000 4 关键 特征 , 并 构建 基于 随机 梯度 下 降 法 的 特征 权重 学 习 算法 ， 
$m] ERARA; ig. Jg T faith [RH IX Ze 4 3 FUR 
ET HER, SALIRE RERA, KMT AA 
2x4 同 地 区 恐怖 袭击 事件 的 科学 分 级 ， 为 明确 安全 态势 、 以 可 视 

化 方式 实现 安全 预警 威胁 提供 了 基础 。 

«i 1.1 文本 特征 的 数值 量化 

BSSSSSSSPSSBSSSZSZIBSD 为 了 建立 合理 且 准 确 的 评估 模型 ， 需 要 收集 恐怖 袭击 事 
人 件 详细 的 相关 信息 ， 包 括 事件 发 生 的 时 间 、 地 域 和 财产 损失 
图 1 1998-2017 年 恐怖 袭击 事件 数量 统计 图 等 。 而 GTD 中 提供 了 详细 的 事件 记录 。 本 文 将 仙 怖 袭击 事 
Fig.1 The number of terrorist attacks in 1998-2017 件 的 数据 划分 为 四 种 基本 特征 : 数值 型 特征 ， 文 本 型 特征 ， 
目前 针对 怒 怖 袭击 事件 的 研究 主要 是 对 特定 场景 下 (地 ”二 分 类 型 特征 ， 多 分 类 型 特征 。 在 众多 类 型 特征 中 ， 由 于 各 
铁 、 机 场 等 区 域 ) 的 恐怖 主义 事件 的 分 析 55， 以 及 恐怖 组 织 。 类 型 特征 具有 不 同 表 示 方 式 ， 无 法 直接 使 用 统一 的 模型 对 其 
的 行为 分 析 和 预测 方面 四 。 这 些 研究 仅仅 分 析 了 现 有 的 恐 。 进行 综合 分 析 。 为 了 保证 评估 结果 的 准确 性 ， 首 先 需要 对 收 


怖 柳 击 事件 所 带 来 的 危害 及 其 风险 ， 并 未 通过 具体 的 量化 数 集 到 的 各 类 数据 进行 量化 处 理 。 
据 分 析 来 评估 事件 危害 性 ， 因 此 无 法 为 境外 活动 提供 安全 出 在 恐怖 袭击 事件 数据 中 ， 由 于 数值 型 特征 、 二 分 类 特征 
行 建议 。Inyaem 等 人 02 则 提出 了 一 种 框架 ， 自 适应 模糊 推理 和 多 分 类 特征 都 直接 采用 数值 方式 表示 ， 而 文本 特征 的 表示 
系统 (adaptive neuro-fuzzy inference systems, ANFIS) ) 对 泰 方式 与 其 他 类 型 特征 有 明显 差异 ， 因 此 ， 采 用 如 下 三 步 实现 
境内 发 生 恐 怖 主义 事件 进行 分 级 ， 该 系统 利用 模糊 逻辑 理 文本 特征 的 量化 : 首先 ， 本 文 首先 利用 词 袋 模型 形成 词 频 文 


论 中 自动 识别 和 隶属 函数 调整 机 制 ， 取 得 了 比较 好 的 恐怖 袭 。” 档 , 去 掉 热 词 、 停 用 词 和 词 频 较 少 的 词汇 。 其 次 , 使 用 TF-IDF 
击 事件 分 级 和 安全 态势 评估 结果 。 模 型 所 采用 的 数据 来 自 泰 。” 实现 文档 的 向 量化 表示 。 最 后 ， 运 用 自 适应 的 KNN 算法 对 
国 南 部 三 个 省 份 轴 怖 秦 击 事件 相关 的 新 闻 文章 。 然 而 ,为 了 文本 进行 聚 类 ， 最 终 实现 文本 特征 的 数值 量化 。 

能 够 准确 地 评估 境外 安全 态势 ， 需 要 对 榴 怖 柳 击 事件 的 所 有 文本 特征 数量 化 的 具体 步骤 如 下 所 示 : 

相关 信息 进行 综合 评估 。 其 中 ， 恐 怖 袭击 事件 相关 的 数值 型 a) 使 用 词 袋 模型 将 文本 以 数值 特征 向 量 的 形式 来 表示 。 
特征 (死亡 人 数 等 )， 二 分 类 型 特征 (是 否 为 持续 事件 等 ) ， ”为 整个 文档 集 上 的 每 个 单词 创建 一 个 唯一 的 标记 。 为 每 个 文 
多 分 类 型 特征 (武器 类 型 等 ) 同文 本 型 特征 相 比 是 更 加 显著 。 档 构 建 一 个 特征 向 量 ， 主 要 包含 每 个 单词 在 文档 上 的 出 现 次 


的 评估 影响 因素 ， 如 何 科学 融合 各 类 特征 构建 有 效 的 评估 模 — 数 。 
型 是 境外 活动 安全 态势 评估 需要 解决 的 首要 问题 。 b) 使 用 TF-IDF 来 获取 词 的 权重 。7F -1DF 是 一 种 用 于 信 
综 上 所 述 ， 要 实现 境外 活动 安全 评估 模型 的 建立 ， 主 要 息 检索 与 数据 挖掘 的 常用 加 权 技术 。7F 意思 是 词 频 ，1DF 意 
有 两 大 挑战 ， a) 相关 数据 类 型 复杂 多 样 ， 数 据 量 庞大 ， 应 该 。 思 是 逆向 文件 频率 。7F -IDF 可 以 定义 为 词 频 x 逆 文 档 频 率 : 
如 何 对 其 进行 处 理 与 整合 ， 并 实现 其 权重 参数 的 合理 调 优 :b) TF  IDF(,d) = TF (,d)x IDF (d) a) 
在 没有 相关 国际 分 类 分 级 标准 的 前 提 下 ， 如 何 准确 客观 地 评 。 ”其 中 : FOL 表示 单词 ?在 文档 4 中 的 出 现 次 数 , 1DF(,4) 为 逆 
估 境 外 活动 安全 态势 。 针 对 以 上 两 个 问题 ， 本 文 提出 了 一 种 ”文档 频率 ， 计 算 公式 如 下 
基于 多 类 别 参数 随机 调 优 的 境外 活动 安全 评估 模型 。 运 用 大 可 
数据 分 析 技术 ， 构 建 数据 量化 、 第 选 机 制 ， 实 现 数据 的 统一 EIE) 

化 表示 。 随 后 对 统一 后 的 特征 进行 降 维 ， 去 除 影响 评估 结果 其 中 : 必 表 示 文 档 的 总 数 ， qd) 表示 包含 单词 ?的 文档 4 的 
的 数据 。 降 维 后 的 数据 自 适应 调整 模型 参数 ， 并 建立 分 级 评 。 数量 。 
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通过 以 上 步骤 可 以 得 到 文档 的 向 量化 表示 。 (b) 同 样 利用 军法 将 特征 值 和 对 应 的 特征 向 量 
co) 使 用 KNN 算法 对 文本 进行 分 类 ,该 算法 是 机 器 学 习 中 i xcu ed 

HANNA EXXETRE. NA. zéguewue 1000200 AARE: HERD, 

而 被 广泛 应 用 0451。 相 较 于 其 他 文本 分 类 算法 ，KNN 在 分 类 c) 计 算 主 成 分 贡献 率 和 累计 贡献 率 。 

性 能 上 更 为 出 色 。 以 下 是 使 用 KNN 对 文本 进行 分 类 的 具体 主 成 分 贡献 率 为 

DH: Fu 
(a) 计 算 测 试 数据 与 各 个 训练 数据 之 间 的 距离 。 $a d (8) 

DG. y) = Qs - vd )? (3) 累计 贡献 率 为 

其 中 ，P>1, 当 p=2 时 ， 是 欧式 距离 ， 当 p=1 时 为 曼哈顿 距 i 

Tuy 2A 

P E, i=1;2 pes z (9) 
〈b) 按 照 距离 的 递增 关系 进行 排序 ; Sa 
选取 距离 最 小 的 K 个 点 ; e 
确定 前 K 个 点 所 在 类 别 的 出 现 频率 ; 将 量化 处 理 后 的 数据 通过 上 述 降 维 方法 进行 处 理 与 计 
返回 前 XxX 个 点 中 出 现 频率 最 高 的 类 别 作为 测试 数据 的 算 ， 比 较 其 累计 贡献 率 ， 筛 选 出 主要 影响 特征 。 一 般 来 说 ， 

预测 分 类 。 可 以 根据 特征 值 的 大 小 (以 大 于 等 于 1 为 原则 ) 或 者 累积 方 
fr k 值 的 确定 中 ， 本 文 使 用 Kk 折 交 叉 验 证 估算 KNN 算 差 贡献 率 〈 大 于 70%) 来 选取 主 成 分 。 通 过 降 维 ， 有 效 去 除 

法 中 的 K 值 :将 全 部 训练 集 5 分 成 上 个 不 相交 的 子 集 , 假设 S 了 数据 中 的 无 关 部 分 , 减 小 无 关 特征 对 安全 态势 评估 的 影响 。 

— LAM m E BR RS — 影响 评估 结果 的 杂质 被 去 除 后 ， 需 要 进一步 学 习 各 个 特 

PF 的 训练 样 例 个 数 为 m， 那 么 每 一 个 子 集 有 pr 个 训练 样 例 。 。 征 的 指标 权重 ， 构 建 综合 评估 模型 。 指 标 权重 是 指 该 指标 在 

每 次 从 分 好 的 子 集中 , 选 出 一 个 作为 测试 集 ， 另 外 上 个 作为 整体 评价 中 的 相对 重要 程度 49。 在 多 因素 的 各 种 评价 决策 问 

训练 集 ; 根据 训练 集 得 到 模型 ; 根据 模型 对 测试 集 进行 测试 ， 题 中 ， 确 定 各 因素 的 权重 是 评价 决策 的 关键 之 一 。 在 境外 活 

得 到 分 类 率 ; 计算 天 次 求 得 的 分 类 率 的 平均 值 ， 作 为 模型 的 动 安 全 评估 模型 的 建立 中 ,指标 权重 的 大 小 取决 于 很 多 因素 ， 

最 终 分 类 率 。 通 过 以 上 步骤 可 以 确定 K 的 值 ， 并 最 终 得 到 文 如 定性 指标 、 定 量 指标 、 主 观 因 素 、 客 观 因素 等 ， 并 且 指 标 

本 类 数据 数值 量化 的 结果 。 与 指标 之 间 也 存在 着 错综复杂 的 关系 。 因 此 ， 客 观 、 合 理 地 

1.2 境外 活动 安全 评估 模型 权重 的 确定 设 定 指标 权重 ， 对 芍 怖 克 击 事件 最 终 评估 结果 有 着 决定 性 的 
通过 对 各 类 数据 的 量化 处 理 ， 可 以 获得 统一 形式 的 各 类 意义 。 

特征 数据 ， 便 于 后 续 对 数据 的 处 理 。 量 化 后 的 特征 中 ， 仍 然 权重 的 确定 方法 不 一 而 足 ， 传 统 的 权重 确定 方法 往往 只 

有 一 部 分 无 关 数 据 存在 ， 它 们 对 于 模型 的 评估 结果 产生 了 一 考虑 了 事件 的 模糊 性 ， 并 且 在 特征 选择 与 权重 确定 时 ， 已 经 

定 干扰 。 为 了 更 好 地 对 事件 分 级 的 准确 性 进行 评估 ， 本 文 对 有 明确 的 判断 标准 ， 而 无 法 从 客观 数据 中 根据 属性 重要 性 确 

数据 进行 降 维 ， 去 除 无 关 特 征 。 定 各 属性 的 客观 权重 09。 而 随机 梯度 下 降 算 法 作为 梯度 下 降 
站 算法 的 一 个 变种 ， 在 处 理 大 规模 训练 数据 的 问题 是 有 很 好 的 
DLA n 个 特征 ， 每 个 特征 共有 z 个 变量 ， 将 原始 数据 表现 L711， 该 算法 采用 随机 梯度 代替 梯度 来 进行 迭代 更 新 ， 导 

EREM: 致 其 每 一 次 迭代 的 代价 很 小 ，= 并 且 不 受训 练 集 规 模 的 影响 。 

Xi Xo X. 使 用 随机 梯度 而 不 是 梯度 的 另 一 个 优点 是 ， 当 目标 优化 问题 
x Au n 3. (4) 不 是 凸 优化 问题 时 ， 使 用 梯度 下 降 的 方法 能 否 收敛 到 全 局 最 
E : RAZR AMEK ERA. — EARE A a 
Fm n ^ 局 部 极 值 ， 将 很 难 从 局 部 极 值 中 跳出 。 随 机 梯度 下 降 算 法 可 
b) 将 原始 数据 标准 化 : 以 在 很 大 程度 上 解决 这 个 问题 68。 鉴于 以 上 优势 ， 本 文采 用 
xoMER Lupa. gy 随机 梯度 下 降 算法 对 改 怖 袭击 事件 中 各 属性 的 权重 值 进行 训 
N 练 。 梯 度 下 降 法 先 随机 给 出 参数 的 一 组 值 ， 然 后 迭代 更 新 参 
X PE EENE = 数 ， 使 每 次 更 新 后 的 损失 函数 更 小 ， 直 到 达到 最 优 。 首 先 ， 
kh: x xd. ss 为 样本 离 差 阵 S 的 元 素 。 特征 权重 损失 函数 如 下 : 
BERE x 已 进行 标准 化 。 计 算 变 量 * 的 相关 系数 矩阵 为 cbe Xon "m 
LN (6) 其 中 : vw 为 不 同 特征 权重 ，2 为 偏 置 ，7 为 训练 数据 集 实 例 
Po. d 个 数 ，x 为 输入 值 ，a 为 当 x 输 入 时 的 输出 值 。 本 模型 的 目 
Lu Ra cU fu 标 是 求解 , 当代 价 函 数 C0w,b) 最 小 时 , 确定 不 同 特征 权重 w 的 
Hp: y AET x 与 国之 间 的 相关 系数 ， 其 计算 公式 为 取 值 。 
加 E 算法 ”基于 随机 梯度 下 降 的 多 特征 模型 学 习 算 法 
六 =- 各 (x) eu) E 输入 : 数据 集 § ， 终 止 距离 s 。 
j E m m 初始 化 权重 w=0，, fiii b-0, batch size: n=32, JX a —0. 
" 输出 : 权重 w 。 
计算 R 的 特征 值 4 和 特征 向 量 。， 共 分 为 两 步 : a) 随 机 选择 n CK nes ) 个 样 例 进行 训练 ; 
(a) 解 特征 方程 -al=0， 用 宕 法 求 出 特征 值 TE E 
Ahüsibedio edt BASLER ES b) 根 据 代价 函数 计算 偏 导数 VC ,其 中 YC= 75 VG ; 
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Wumvc|«e, WkIBIZEEEe), (UU uEXEUR b); 
c) 计算 下 降 距 离 do, d, --avC ; 
d) 更 新 所 有 参数 模型 ， 更 新 方程 如 下 : 


8C 
mw =m? > 3 
nT Ow, 
6C 
b, b =b Ly e 
n^; Ow, 


e) 重 复 上 述 步骤 ， 直 至 达到 最 优 解 ， 
f) 返 回调 优 后 的 权重 。 
1.8 境外 出 行 安全 分 级 评估 模型 建立 

为 了 实现 对 不 同 地 区 安全 态势 的 准确 评估 ， 有 针对 性 地 
提出 意见 与 建议 ， 需 要 对 相关 事件 进行 分 级 。 本 文通 过 集 对 
分 析 思 想 实现 安全 评估 结果 的 分 级 。 

通过 1.2 节 中 的 数据 处 理 ， 现 将 不 同 特征 的 权重 值 列 为 
权 值 矩阵 如 下 : 


W = (W, Was... Wp) (11) 
设 系 统 将 事件 危害 性 等 级 划分 为 ac…:a 共 n 个 级 别 ， 
组 成 分 级 模型 的 评分 集合 ， 对 于 每 个 级 别 ， 有 太 , 扫 … 心 共 m 


个 特征 ， 每 个 级 别 的 每 个 特征 都 有 一 个 特征 值 ， 将 其 记 为 
aiG=12.m7=12… 及 ， 由 此 可 以 得 到 评估 和 矩阵 为 
ai dp a 
an An cU An 
R= | : iod j (12) 
Am An c gs 


将 矩阵 R 进 行 归 一 化 处 理 ， 得 到 除权 之 后 的 评估 和 矩阵 R' 


为 
d, dy d, 
p= |n da d (13) 
d. d, d, 


其 中 : d) 表示 分 类 评价 数 与 评价 向 量 总 数 M 的 比值 ， 即 
dj = 2.4, € (0.1) o 
M 


经 过 上 述 分 析 , 得 到 权重 向 量 W， 除权 后 的 评估 矩阵 R 


及 联系 分 量 和 矩阵 EE。 由 此 ， 可 以 构造 出 境外 出 行 安 全 分 级 评 
估 模 型 。 
设 安全 分 级 评估 模型 为 H ， 则 
H -W-R'-E- 
[ dy dy d, 1 
dy d d t 
(Wis Wast Wp Wp) È ! : Hm (14) 
d 一 11 d -12 E d is 加 -2 
L dm dus 9d P 


其 中 ， qnos p 为 联系 分 量 系 数 。 
将 式 (14) 展开 ， 可 写成 为 


H > wedy + > Wedyati 十， 十 > Wd alo + >» Wedin p (15) 
k=l k=l k=l k=l 


X (15) 中 ， 


> weda €[0,1], > wdis e[0,1),..., 
pa (16) 
> wedoan €10,11 > wede e[0.1] 
k=l k=l 
H by Wy dy +》， We di; tc» We dimi 23 We dy, =1, 
k=l k=l k=l $al (17) 


ti [一 了 ..., t2 e[711] 


通过 上 述 公 式 推导 ， 可 以 通过 求解 联系 系数 确定 分 级 类 
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别 数量 以 及 各 个 级 别 联系 系数 的 取 值 范围 ， 最 终 通 过 对 各 数 
据 的 计算 确定 各 个 事件 所 在 的 级 别 。 分 级 的 确定 对 于 境外 出 
行 安全 态势 评估 系统 的 建立 具有 重要 意义 ， 根 据 分 级 结果 可 
以 评估 各 个 级 别 事件 危险 程度 ， 从 而 更 有 针对 性 地 提出 相应 
的 境外 活动 安全 建议 。 


2 ”实验 分 析 


2.1 数据 预 处 理 
本 次 实验 采用 GTD 中 1998 一 2017 年 的 数据 ， 共 有 
114 183 条 。 由 于 GTD 中 数据 特征 类 型 多 样 ， 为 了 更 好 地 对 
问题 进行 分 析 与 建 模 ， 本 文 首先 将 这 些 特征 进行 分 类 。 基 于 
数据 特征 的 类 型 将 其 分 为 : 数值 型 特征 ， 文 本 型 特征 ， 二 分 
类 型 特征 ， 多 分 类 型 特征 。 各 类 型 特征 数量 如 表 1 所 示 。 

根据 GTD 的 说 明 ， 在 数据 搜集 过 程 中 存在 一 定数 据 缺 
失 和 不 完备 03。 例 如 GTD 中 对 死亡 人 数 (kib 字段 的 曾 
YR: 死亡 的 总 人 数 ， 包 括 因 该 事件 直接 导致 死亡 的 所 有 遇难 


者 和 袭击 者 。 如 果 有 死亡 的 证 据 ， 但 是 没有 报道 数字 或 它 太 
模糊 而 不 能 使 用 ， 这 个 字段 记录 为 空 值 。 
表 1 各 类 型 特征 数量 统计 表 
Table 1 Statistical table of different types of features 
特征 类 型 寺 征 数量 
数值 型 特征 24 
文本 型 特征 29 
二 分 类 型 特征 5 
多 分 类 型 特征 47 
数据 的 缺失 影响 了 境外 出 行 安全 评估 模型 评估 结果 的 


EE 
Au 


确 性 ， 因 此 需要 采取 可 行 的 方法 来 对 数据 进行 处 理 。 目 前 
缺失 值 的 插 补 方法 主要 有 个 案 剔 除法 02、 均 值 或 方差 蔡 换 法 
P0、 热 卡 填充 法 PC、 回归 替换 法 以 及 多 重 蔡 代 法 PC 等 。 由 于 
本 文 所 选取 的 数据 量 庞大 ， 且 数据 类 型 多 样 ， 只 使 用 一 种 方 
法 对 数据 进行 补充 显然 是 不 正确 的 ， 因 此 本 文中 对 不 同类 型 
数据 采用 不 同方 式 进行 填充 与 处 理 。 
数值 类 特征 中 ， 针 对 各 数据 类 型 的 特征 ， 选 择 不 同方 法 
进行 填充 ， 如 对 于 死亡 人 数 ， 主 要 采用 均值 法 进行 填充 。 对 
于 所 涉及 的 金额 ， 采 用 热 卡 填 充 等 。 对 于 文本 类 数据 ， 本 文 
先 将 所 有 数据 实现 向 量化 处 理 , 然 后 对 缺失 的 部 分 进行 补 零 ， 
实现 文本 类 数据 的 填充 与 补 齐 。 针 对 多 分 类 类 型 数据 ， 由 于 


每 一 种 类 型 都 具有 其 特定 意义 与 权 值 ， 本 文 使 用 多 值 填充 来 
对 其 进行 处 理 。 
通过 上 述 数据 预 处 理 操作 ， 为 下 文 进行 安全 态势 评估 建 


模 与 分 析 提 供 了 良好 的 基础 。 
2.2 安全 态势 评估 结果 分 析 
本 文 针 对 现 有 研究 中 存在 的 缺陷 ， 采 用 基于 多 类 别 参数 
随机 调 优 的 方式 ， 实 现 境 外 活动 安全 评估 模型 的 建立 。 经 过 
对 特征 多 样 ， 数 据 量 庞大 的 数据 处 理 后 ， 获 得 统一 形式 的 数 
据 表示 ， 随 后 对 数据 进行 降 维 处 理 ， 获 得 关键 特征 。 采 用 随 
机 梯度 下 降 算法 进行 权 值 分 配 ， 从 而 得 到 安全 态势 评估 模型 
的 关键 特征 权重 分 配 ， 然 后 对 特征 进行 量化 分 析 ， 最 终 得 到 
量化 分 级 模型 。 在 分 级 基础 上 ， 实 现 对 现 有 国际 环境 的 态势 
评估 。 

为 了 更 好 的 表示 分 级 结果 ,本文 依据 恐怖 事件 的 危害 性 ， 
将 境外 出 行 活动 的 安全 级 别 细 化 为 五 级 ,分 别 为 V 级 (严重 
和 危险) 、IV 级 (危险) . HL 级 RER), 级 (轻微 危险 ) 、 
I 级 〈 较 安全 ) ， 级 别 代表 颜色 分 别 对 应 为 深 红 色 、 红 色 、 
Rif. WO. WC. Re Bu. 


3 


根据 本 文 所 提出 的 模型 , 对 GTD 中 114 183 条 事件 信息 
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进出 ， 有 具有 严重 / 


乞 险 性 的 事件 相对 较 少 , 仅 有 14 件 。 具有 严 。 ”统计 的 、 时 间 跨 度 在 1998-2017 年 范围 内 的 、 历 史上 最 严重 
重 危 害 性 的 恐怖 袭击 事件 有 147 件 。 对 于 发 生 这 些 事件 的 地 。 ”的 恐怖 兢 击 事件 的 分 布 ， 分 析 本 文 分 级 结果 与 对 比方 案 分 级 
域 ， 是 不 建议 出 行 的 。 这 些 事件 所 涉及 的 地 域 ， 在 本 文 所 提 ” ”结果 的 准确 率 ， 其 结果 如 表 S 所 示 。 

出 的 分 级 模型 中 , 被 认为 具有 较 高 的 危险 性 。 而 被 评 为 “ 较 危 。 其 中 ,准确 率 ( 4 ) 由 模型 分 级 正确 事件 数 占 总 事件 数 的 比率 。 


iL] 


险 ”"“ 轻 微 危险 "以 及 “ 较 安 全 "三 个 级 别 的 事件 较 多 ， 相 应 的 其 公式 如 下 : 


地 域 也 发 生 了 鸭 怖 雍 击 事件 ， 存 在 着 不 安全 的 因素 ， 但 相对 A -被 正确 分 级 的 恐怖 柳 击 事件 数 (18) 
而 言 可 以 作为 出 行 的 选择 。 deti ET UR 
表 2 境外 活动 安全 分 级 表 表 5 不 同 模型 评估 及 分 级 
Table 2 Security classification of overseas activities Table 5 Evaluation and grading of different model 
事件 级 别 V 级 V% II 级 1% 1% 模型 准确 率 /% 
危害 程度 ”严重 危险 — 危险 — 较 危 险 ”轻微 危险 — 较 安全 境外 出 行 安 全 分 级 评估 模型 92.30 
颜色 表示 RAE aE HE 黄色 蓝 色 FISs 84.61 
X3 分 级 结果 统计 表 从 表 中 可 以 看 出 ,对 比方 案 的 分 级 准确 率 为 84.6196, 而 
Table 3 Statistical table of classification results 本 文 所 提出 的 安全 态势 评估 模型 的 准确 率 为 92.30%, dE XE 
事件 数量 ”级 别 ”危害 程度 颜色 建议 与 意见 怖 袭击 事件 的 分 级 评估 中 ， 本 文 所 提出 的 模型 更 准确 。 
14 V 严重 危险 RAE 不 建议 出 行 2.3 安全 态势 评估 模型 应 用 
147 IV 危险 红色 有 高 度 危险 性 本 文 基于 多 类 别 参数 随机 调 优 ， 建 立 了 境外 活动 安全 评 
894 II[ 较 危 险 REG 有 危险 性 估 模 型 ， 实 现 了 对 不 同 地 区 安全 态势 的 评估 。 根 据 模型 评估 
33473 I 轻微 危险 黄色 ”具有 一 定 危险 性 和 分 级 结果 ， 本 文 构建 了 境外 活动 安全 态势 评估 系统 。 该 系 
79655 I 较 安全 蓝 色 具有 潜在 危险 统 基于 模型 的 分 级 结果 ， 对 各 个 国家 和 地 区 的 、 不 同时 段 的 
为 了 初步 验证 本 文 所 提出 的 境外 安全 态势 评估 模型 的 准 ” ”安全 态势 进行 分 析 与 评估 , 给 出 相应 的 安全 出 行 建议 。 同时 ， 
确 性 ， 本 文 将 Worldatlas 该 系统 还 实现 相关 分 级 结果 的 可 视 化 ， 以 直观 的 、 可 交互 的 
Chttps://www.worldatlas.com/articles/worst-terrorist-attacks-in 方式 展现 分 析 结 果 ， 提 供 良 好 用 户 体验 。 当 出 境 人 员 使 用 本 
-history.html) 中 时 间 跨 度 在 1998-2017 年 范围 内 的 、 历 史上 系统 时 ， 能 够 更 直观 地 选择 境外 出 行 目的 地 与 出 行 时 间 。 
最 严重 的 恐怖 袭击 事件 ， 使 用 本 文 所 提出 的 安全 态势 评估 模 为 了 展示 各 大 洲 恐 怖 袭击 事件 发 生 的 频率 随时 间 的 演化 


型 进行 评估 , 其 结果 如 表 4 所 示 。 从 表 中 可 以 看 出 , Worldatlas 趋势 ,本 系统 将 近 20 ERAMA 
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pun 
IE 
iT 
ur 
IH 


照 其 发 生 的 国家 与 


中 所 列 出 的 事件 都 被 分 级 为 “严重 危险 ”与 “ 较 危 险 ” 的 级 别 之 。 ”地 区 所 在 的 大 洲 进行 统计 并 绘制 趋势 图 ， 当 鼠标 放置 于 横 坐 
H, HF Worldatlas 中 对 恐怖 袭击 事件 的 记录 方式 按照 整个 ” 标 上 的 菜 个 年 份 时 ， 可 以 相应 地 显示 出 该 年 份 中 各 大 洲 事件 
事件 进行 描述 与 分 析 ， 与 GTD 中 对 事件 记录 的 方式 不 同 。 发 生 的 数量 ， 如 图 2 所 示 。 
对 此 对 于 部 分 事件 GTD 中 的 查找 结果 与 Worldatlas 中 对 其 记 , r | —- am 
录 存 在 不 同 。 EEE e 
除 此 之 外 ， 本 文 所 提出 的 分 级 模型 对 于 同一 时 段 内 的 高 i rd puni 
危 分 级 结果 还 包括 如 “Sinjar 大 履 杀 事件 ”Tabqa TEH » i d. Y 
dPAPREBGEAUU. ROSE ED EM dSdHE. 对比 a JL | 
Worldatlas 中 的 统计 数据 ， 本 文 所 提出 评估 模型 更 加 准确 与 4 Am- ] 
全 面 ， 可 以 作为 境外 活动 安全 态势 评估 的 依据 。 à Pann i 
RA 世界 地 图 集 所 统计 历史 上 最 严重 的 恐怖 袭击 事件 ^ Lu 
Table 4 Terrorist attacks in the world atlas à pret 一 十 Foo EE 
排名 事件 名 称 死亡 人 数 发 生地 域 评估 结 CEET un in m rmm 
1 9-11 恐怖 袭击 2996 ”美国 V mo » m 0 ao WHO ow 
2 ”2007 年 Yazidi 社区 爆炸 事件 — 500 DATA M 图 2 Sf WU ES TMR ENEE 
3 2013 年 5 月 伊拉克 袭击 449 拉克 V Fig.2 The trend of terrorist attacks on each continent 
4 — CMDGDSOMp quce; 389. Wamo V 为 了 直观 地 观察 事件 的 地 域 分 布 ， 本 系统 实现 了 数据 的 
2 可视化 表示 。 根 据 本 文 所 提出 模型 的 分 级 结果 ， 对 不 同 级 别 
7. 2014 年 Gambor Ngala dii 336+ 尼日利亚 VI i dn 
d 俄罗斯 公 富 爆 炸 事件 308 - i 染色 。 对 于 每 一 个 级 别 ， 都 使 用 该 色 系 的 渐变 色 来 标志 事件 
9 1993 年 孟买 爆炸 事件 257 印度 VI 发 生 的 多 少 。 
10 2001 Ez EH c I ess 252 ”安哥拉 VI 系统 可 以 在 左 侧 列表 中 选择 相应 的 级 别 ， 当 选中 后 ， 右 
11 1998 年 美国 大 使 馆 爆 炸 事 件 224 美国 VI 侧 会 显示 出 对 应 级 别 事件 的 地 域 分 布 。 如 图 3 所 示 ， 图 中 为 
12 2012 年 1 月 尼日利亚 袭击 222+ 尼日利亚 VI 被 评 为 V 级 “严重 危险 ”的 国家 和 地 区 的 分 布 图 ， 对 比 图 4、 
13 2006511 月 23 OPAKI o 伊拉克 vI 5 中 被 评 为 II 级 “ 较 危险 ”与 1 级 “ 较 安全 ”的 国家 和 地 区 分 


图 ， 可 以 看 出 ， 随 着 事件 危害 性 级 别 的 下 降 ， 恐 怖 袭击 事 
的 覆盖 范围 逐渐 变 大 ， 但 是 大 部 分 国家 和 地 区 还 是 相对 安 
的 。 对 于 每 个 级 别 中 都 出 现 的 国家 和 地 区 ， 则 为 恐怖 袭击 
个 高 发 地 域 ， 对 于 这 样 的 国家 和 地 区 ， 则 不 建议 作为 出 行 
择 。 


为 了 进一步 验证 本 文 所 提出 的 境外 安全 态势 评估 模型 的 
准确 性 ， 本 文 实现 了 Inyaem 等 人 [9 所 提出 的 安全 评估 系统 
(fuzzy inference systems, FISs) 作为 对 比方 案 ， 使 用 FISs 
对 GTD 中 的 数据 进行 评估 与 分 级 。 通 过 对 比 Worldatlas 中 所 
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zi L va 
va SM i m vd E 
cum qe A cm i 
E: 1 级 
口 1 级 1 级 
图 3 V 级 事件 地 域 分 布 图 图 7 伊拉克 IV 级 事件 统计 图 
Fig.3 Regional distribution of class V Fig.7 Iraqi level IV line chart 
va r 当 点 击 各 个 级 别 分 布 图 中 所 选中 的 特定 国家 或 地 区 时 ， 
ud E € 4 系统 中 会 弹出 在 当前 级 别 下 这 个 国家 或 地 区 历年 发 生 的 且 评 
m í 级 为 当前 级 别 的 统计 图 ， 如 图 7 所 示 。 通 过 上 述 操作 ， 对 于 
zi "a 伊拉克 地 区 而 言 ， 其 念 怖 袭击 事件 发 生 较 为 频繁 ， 不 作为 个 
e Age 人 或 企业 出 行 选择 ， 如 有 必要 ,在 3-7 月 ，11-1 月 可 以 作为 
h 出 行 的 时 间 选 择 。 
本 系统 基于 模型 分 级 结果 ， 对 安全 态势 进行 进一步 的 分 
析 与 可 视 化 展示 。 方 便 境 外 出 行人 员 直 观 地 了 解 安 全 态势 ， 
作出 合理 的 出 境 选择 。 
图 4 ”II 级 事件 地 域 分 布 图 3 fos 
Fig.4 Regional distribution of class III 本 文 提 出 了 一 种 基于 多 类 别 参 数 随机 调 优 的 境外 活动 安 
一 全 评估 模型 。 依 据 现 有 数据 ， 实 现 了 有 效 的 境外 安全 态势 评 
" 估 。 对 比 现 有 研究 ， 本 模型 能 够 适应 全 类 别 参数 ， 并 且 自 适 
下 级 应 地 对 各 类 参数 进行 模型 调 优 。 实 验 结果 表明 ， 本 文 所 提出 
ET. ; 的 模型 能 够 准确 评估 不 同 地 区 安全 态势 。 在 模型 基础 上 构建 
mi V AA 的 安全 态势 评估 及 预警 系统 可 以 对 不 同 地 区 安全 态势 及 时 评 
估 并 预警 ， 以 便 合理 安排 境外 活动 ， 确 保 人 身 安全 ， TEX 
高 的 应 用 价值 。 
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